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@ Verfahren zum Ermittein und Klassifizieren von Storgerauschtypen 

@ Mit einer fiir die Spracherkennung geeigneten Anordnung 
sol) bei relativ geringem Speicher- und Rechneraufwand 
zunachst ein Gerausch eindeutig oder annahernd bestimmt 
werden. Das daboi erzielte Ergebnis soil zur Optimierung 
einer Spracherkennung oder zur Erzeugung von Schaltbe- 
fehlen dienen. 

Es wird zunachst ein Standardcodebuch erstellt, welches die 
Refe re nz muster von Sprachau&erungen ohne Storgerausch 
aufnimmt. Danach werden SprachauSarungen zusammen 
mit verschiedenen Storgerauschtypen einzein trainiert, wo- 
bel jeweils Merkmalsvektoren erzeugt werden, die mit im 
Standardcodebuch vorhandenen Merkmalsvektoren vergli- 
chen werden. Die dabei entstehenden Haufigkeitsverteilun- 
gen der Merkmalsvektoren werden in einem Indexspeicher 
abgelegt. Die im Indexspeicher abgelegten Haufigkeitsver- 
tellungen der tndizes von Merkmalsvektoren werden dann 
■ mit den Indizes von Merkmalsvektoren aus der aktuell 
eingegebenen, mit einem Storgerauschtyp behafteten 
SprachauBerung vergiichen. Wenn sich dabei ein Extrem- 
wart erglbt, so ist ein Storgerauschtyp gefunden worden. 
Das dabei entstehende Signal kann zu einer genaueren 
Spracherkennung oder zur Erzeugung von Schaltbefehlen 
dienen. 
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Beschreibung 

Die Erfindung betrifft ein Verfahren zum Ermitteln und Kiassifizieren von Storgerauschtypen unter Anwen- 
dung von fur die Sprachanalyse bekannten Verfahren nach dem Oberbegriff des Patentanspruchs 1. 
5 In einem Fachbericht mit dem Titel "Einzelwort-Erkennung in gerauschvoller Umgebung" der in einem 
Tagungsband zur Konferenz Uber Sprachverarbeitung unter ungunstigen Bedingungen (Cannes-Mandelieu, 
vom 10. bis 13. Nov. 1992; ISSN 1018— 4554) ab Seite 215 abgedruckt ist, wird ein Verfahren beschrieben. womit 
eine Spracherkennung auch dann ermoglicht wird, wenn Gerausche auftreten. Unter Anwendung der bekannten 
Vektorquantisierung wird dabei fur jedes spezifische Gerausch in einer Trainingsphase ein Satz von "Verborge- 

10 nen Markov-Modellen" erzeugt und abgespeichert. Beim Erkennen einer mit Gerausch behafteten SprachauBe- 
rung muB dann eine Vielzahl von Vektorquantisierern vorgesehen warden, um die verschiedenen Markov-Mo- 
delle ansteuern zu konnen, damit dasjenige herausgefunden werden kann, welches die besten Erkennungsergeb- 
nisse iiefert. Wie auf Seite 216 beschrieben wird, ist dazu eine sehr hohe Rechnerleistung erforderlich und es 
konnen nur SprachauBerungen erkannt werden, die mit Gerauschen behaftet sind, fur welche bereits Markov- 

15 Modelle vorhanden sind. Fiir den Fall, daB in dem zu erkennenden Eingangssignal ein Gerausch vorhanden ist, 
welches nicht katalogisiert ist, mussen zusatzliche MaBnahmen durchgefiihrt werden. 

Zur Losimg dieses Problems ist eine zusatzliche sogenannte spektrale Subtraktion vorgesehen. Hierzu sind 
zusatzliche mit Vektorquantisierung trainierte Modelle von mdglichen Gerauschtypen erforderlich. Es wird 
dann die sukzessive Vektorquantisierung-Rahmenstorung uber einen Tiefpafi gefiltert und ein Vergleich durch- 

20 gefuhrt. Damit wird erreicht, daB ein moglichst ahnliches Gerausch erkannt wird, welches vom Eingabesignal 
nach dessen Vektorquantisierung subtrahiert wird. Das daraus resultierende Signal wird dann einem weiteren 
speziellen Vektorquantisierer zugefuhrt, womit eine reine Sprache reprasentiert werden soil welche dann mit 
Markov-Modellen der reinen Sprache verglichen wird. Bei einem derartigen Verfahren ist eine groBe Speicher- 
kapazitat erforderlich, und die Rechnerleistung muB relativ hoch sein. 

25 Ausgehend vom vorgenannten Stand der Technik besteht die Aufgabe der Erfindung darin, ein Verfahren 
anzugeben, mit dem bei relativ geringem Speicher und Rechneraufwand zunachst ein Gerausch eindeutig oder 
annahernd bestimmt werden kann. Mit dem dabei erzielten Ergebnis soli die Spracherkennung optimiert werden 
konnen. 

Zur Losung dieser Aufgabe ist eine Merkmaiskombination vorgesehen. wie sie ira Patentanspruch 1 angege- 
30 ben ist 

Damit wird in vorteilhafter Weise erreicht, daB von jedem Storgerauschtyp lediglich eine Tabelle iiber die 
Haufigkeitsverteilung von Merkmalsvektoren gespeichert sein muB. Das Vergieichen einer vom aktuell eingege- 
benen Signal erstellten Haufigkeitsverteilungs-Tabelle der dabei erraittelten Merkmalsvektoren mit gespeicher- 
ten Vergleichstabelien nimmt wenig Rechnerleistung in Anspruch. Das beim Erkennen eines Storgerauschtyps 
35 auftretende Signal kann auBer zur Spracherkennung auch fiir andere Schaltbefehle benutzt werden. 

Ein Ausfuhrungsbeispiel der Erfindung wird nachfolgend anhand von Zeichnungen naher erlautert. 

Es zeigt Fig. 1 ein Blockschaltbild fur das Trainieren und Erkennen von Storgerauschtypen 

Fig. 2 ein Blockschaltbild einer Anordnung zur Erkennung von gestorter Sprache unter Verwendung von 
mehreren Codebuchern 

40 In der Fig. 1 ist eine Anordnung dargestellt, die sowohl zum Trainieren von Sprach- und Gerauschmodellen 
dient und auch zum Erkennen von Sprache und Gerauschen geeignet ist. Um dies zu ermoglichen, wird zunachst 
ungestorte Sprache Spr von einem Mikrofon M aufgenommen und einer Sprachanaiyseeinheit SA zugefuhrt. 
Dort werden einzelne Zeitabschnitte gleicher Lange in sogenannte Merkmalsvektoren MV uberfuhrt. Ober 
einen Vektorquantisierer VQ werden aus diesen Merkmalsvektoren MV die Codebuchvektoren CVl bis CVm 

45 fur das Standardcodebuch SCB trainiert und dort eingetragen sowie jeweils mit einem Index 1 1 bis Im versehen. 
Wenn auf diese Weise ein Standardcodebuch SCB mit ungestorter Sprache trainiert worden ist. so sind darin 
Codebuchvektoren CVl bis CVm enthaiten.die jeweils ihren zugeordneten Index II bis Im haben. Danach kann 
damit begonnen werden, SprachauBerungen Spr zusammen mit Storgerauschtypen SGI bis SGn iiber das 
Mikrofon M einzugeben. Die vom Mikrofon M aufgenommenen Signale werden von der Sprachanaiyseeinheit 

50 SA, wie zuvor bereits beschrieben worden ist, in Merkmalsvektoren MV iiberfiihrt und dem Vektorquantisierer 
VQ zugefuhrt. Der Vektorquantisierer VQ vergleicht nun alle Codebuchvektoren CVl bis CVm mit dem gerade 
anstehenden Merkmalsvektor MV. Dabei wird herausgefunden, welcher Codebuchvektor CVl bis CVm dem 
angebotenen Merkmalsvektor MV am ahnlichsten ist, Der dazugehorige Index, z. B. 12 gelangt dann in eine 
Erfassungseinrichtung EE und wird dort zwischengespeichert. Dies geschieht nacheinander mit alien Merkmals- 

55 vektoren MV, wobei in der Erfassungseinrichtung EE jedem Index zugeordnet die Haufigkeit seines Auftretens 
gespeichert wird. Auf diese Weise entsteht eine Zahlenreihe, die fiir jeden einzelnen Index 11 bis Im angibt. wie 
oft er wahrend der Eingabe der mit einem Storgerauschtyp, z. B. SGI, behafteten Sprache Spr aufgetreten ist. 
Diese Zahlenreihe stellt eine Haufigkeitsverteilung der einzelnen Merkmalsvektoren MV dar, welche fiir den 
betreffenden Storgerauschtyp SGI als charakteristische Haufigkeitsverteilung PRl in einem Indexspeicher ISP 

60 eingetragen wird. Auch fur die ungestorte Sprache Spr kann auf diese Weise eine Haufigkeitsverteilung PRO im 
Indexspeicher ISP vorhanden sein. Der Indexspeicher ISP weist Bereiche, beispielsweise Zeilen auf, die jeweils 
einem Storgerauschtyp SGI bis SGn und auch der ungestorten Sprache Spr zugeordnet sind, in denen jeweils 
die Haufigkeitsverteilungen PRO bis PRn abgelegt sind. 

Mit dem Inhalt dieses Indexspeichers ISP ist es nun moglich, einen Storgerauschtyp SGI bis SGn zu erkennen. 

65 Zu diesem Zweck wird eine SprachauBerung Spr zusammen mit einem unbekannten Storgerauschtyp SGu vom 
Mikrofon aufgenommen und der Sprachanaiyseeinheit SA zugefiihrt. Die dabei entstehenden Merkmalsvekto- 
ren MV werden nun durch den Vektorquantisierer VQ mit alien im Standardcodebuch SCB vorhandenen 
Codebuchvektoren verglichen. Die dabei sich ergebenden Indizes II bis Im von dem jeweils ahnlichsten Code- 
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buchvekior CV werden in deTE^fassungseinrichtung EE zwischengespeichert, wobeiermittelt wird wie haufig 
feweUs e^rinde. ! aufgetreten ist. Die dabei sich ergebende Hauf.gkeitsverteilung FT w.rd emem Verglejchs- 
rirhner VGR angeboten. welcher die Haufigkeitsverteilung PT mit alien im Indexspe.cher ISP befindhchen 
mufiSeiSverSfungen PRO bis PRn vergieicht Bei diesem Vorgang wird vom Vergle.chsrechner em Abwe.- 
chungswert d ermittelt, der sich wie folgt berechnet: 

d(PR(x),PT(x) ) = ^ PT{xi)ld p^l^^J 

Wenn sich bei dieser Gegenuberstellung der Haufigkeitsverteilung PT von Indizes aus den aktuellen Merk- 
makvektoren MV und den im Indexspeicher ISP befindU^ 

Suniswert d ergibt, der ein Minimum aufweist. so hat eine StorgerSuscherkennung SGE stattgefunden Der 
VerSsrechnfr VGR stellt dabei fest. bei welcher im Indexspeicher ISP befindhchen Hauf.gke.tsverte.lung 
PRO bis PRn sich dieser minimale Abweichungswert d ergeben hat Daraus ^esuitiert die B^eschaffenheit <^^^^ 
Signals fur die Storgerauscherkennung SGE. welches angibt. urn welchen Storgerauschtyp SGI bis SGn es s.ch 
hLndelt Die StorgerSuscherkennung SGE kann in Form eines binar kodierten Wortes ausgegeben werden, 
welches direktalsSchalt- Oder Ansteuerbefehlverwendet werden kann. „. ... a , 

in der Fig. 2 ist eine Anordnung dargestellt, bei der mehrere CodebQcher SCB CBl bis CBn verwendet 20 
werden. Diese Anordnung dient dazu, eine Spracherkennung zu optimieren. wenn bekannte oder unbekannte 
Stergerausche vorhanden sind. Das Mikrofon M nimmt die SprachauBerung Spr zusammen m.t bekannten 
Stdrgerauschen SGI bis SGn oder unbekannten Storgerauschen SGu auf und gibt sie an die Sprachanalyseem- 
hett SA ab. In der Sprachanalyseeinheit SA entstehen Merkmalsvektoren MV. die einem Vektorquantisierer 
zugefuhrt werden. Der Vektorquantisierer VQ ist mit einem Codebuchmult.plexer CBM ^jr^^nden^ welcher 
dufch das Storgerauscherkennungssignal SGE eingestellt wird. Damit w.rd gezielt dasjen.ge Codebuch SCB 
CbT bis CBn angesteuert, welches f iir den erkannten Storgerauschtyp zustandig ist. SdbstverstancUich mdssen 
die fiir verschiedene Storgerauschtypen SGI bis SGn vorhandenen CodebQcher CBl b.s CBn vorher trainiert 
worden sefn. FtS- die ungfstGrte Sprache Spr ist das bereits beschriebene Standardcodebuch SCB vorhanden. 
Der Stergerauschtyp SGO entspricht demnach einer ungestorten Spracheingabe Spr- 'n emer Auswerteemnch^ 
tung AE werden dann diejenigen Codebuchvektoren CV aus dem betreffenden Codebuch CBl bis CBn oder 
auch SCB herausgefunden. welche den vom Eingabesignal gebildeten Merkma svektoren MV am ahn .chsten 
sind urn ein Spracherkennungssignal SE zu erhalten. Bei der in Fig. 2 dargestellten Anordnung sind selbstyer- 
sSndUch die funktionsgleichen Komponenten Sprachanalyseeinheit SA. Vektorquantisierer VQ sowie das Stan- 
dardcodebuch SCB mit den in der Fig. 1 dargestellten gleichartigen Einrichtungen identisch. 

Mit der in Fie. 2 dargesteUten Anordnung ist es also mdglich, far eine optimale Spracherkennung gezielt eines 
von mehreren vorhandenen Codebuchern SCB. SGI bis SGn und den jeweik dazu gehorenden diskreten 
Markov-Modellen (HMMS, HMMl bis HMMn) anzusteuern. Hierzu dient das Storgerauscherkennungssignal 
SGE, welches den Codebuchmultiplexer CBM so einstellt daB der Vektorquantisierer VQ mit emem der 
CodebQcher SCB. CBl bis CBn verbunden wird. Dabei konnen auch bei einem unbekannten Storgerausch bOu, 
wofOr kein Codebuch besteht, bessere Ergebnisse bei der Spracherkennung SE erzielt werden. 

Das Storgerauscherkennungssignal SGE kann auch dazu verwendet werden^ die betreffende Storgerausch- 
Quelle zumindest vorQbergehend abzuschalten. So ist es beispielsweisc moghch. auf Grand des erkannten 
sSeraSyps SGI bis SGn mit entsprechenden elektrischen oder elektronischen Schahemnchtungen emen 
LQftIr aaszuschahen oder ein Fenster bzw. eine TOr zu schlieBen. Das St6rgerauscherkennungss.gnal SGE kann 
auch dazu dienen, irgendwelche Einrichtungen zu uberwachen, welche Gerausche von sich geben "nd dabe. 
fhren Betriebszustand erkennen lassen. Es kann also erkanm werden, ob ein wichfges elektnsches oder elektro- 
Ses Gerat in Betrieb ist oder nicht. Hieraus kSnnten Alarmmeldungen abgeleitet werden. wenn z.B. em 
EesdmmYer Gei^usrhty^ von seinem Sollwert abweichL AuBerdem kann eine Spracherkennung SE noch weiter 
vlrSS^en werden. wenn St6rgerauschtypen SGI bis SGn eliminiert worden sind und eine nahezu ungestorte 
Sprache Spr ausgewertet werden kann. 



Patentanspruche 

1. Verfahren zum Ermitteln und Klassifizieren von Storgerauschtypen unter Anwendung yon fiir die 
Sorachanalyse bekannten Verfahren. wobei in einer Trainings- oder Lernphase Referenzmuster gebildet 
werden!Skustisch eingegebene Signale beschreiben und in einem Codebuch abgespeichert werden. urn 
ah Grundlage zur spateren Erkennung dieser Signale zu dienen. 

daB ""Skf St^^'siaSrdcodebuch (SCB) erstellt wird, welches die Referenzmuster von SprachauBerun- 
gen (Spr). dS ohne Storgerausch (SGO) eingegeben und trainiert wurden. in Form von m.t Ind.zes (1 1 bis Im) 
versehenen Codebuchvektoren (CBVl bis CBVm)enthait. „„u.„„„„ /cr-n <;r,n^ 

daB danach die SprachauBerungen (Spr^ ohne und m.t versch.edenen Storgerauschtypen (SGO b.s SGn) 
SrlaTcrt einzX verlrbeitet werden, wobei von den jeweiligen Merkmalsvektoren (MV). d.e durch 
VektoSn^sierung (V^ dem Standardcodebuch (SCB) resultierenden Hau igkeitsverteilungen PRO 
bis PfS der Indizef (I) dirch eine Erfassungseinrichtung (EE) ermittelt und in einem Indexspeicher (ISP) 

dS"L?Abs^hluB d"er Trainingsphase von aktuell eingegebenen SprachauBerungen (Spr). die mit einem 
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zunachst unbekannten Storgerauschtyp (SGu) behaftet sind, Merkmalsvektoren (MV) gebildet werden und 
die Haufigkeitsverteilungen (PT) der Indizes (I), die aus der Vektorquantisierung (VQ) mit dem Standardco- 
debuch (SCB) resultieren, ebenfalls ermittelt werden, 

daB dann diese Haufigkeitsverteilung (PT) mit alien im Indexspelcher (ISP) abgelegten Werten der jeweils 
einem Storgerauschtyp (SGO bis SGn) zugeordneten Haufigkeitsverteilungswerten (PRO bis PRx) vergli- 
chen wird, indem in einem Vergleichsrechner (VGR) ein Abweichungswert (d) durch Summenbildung 
errechnet wird, 

und daB der gesuciite Storgerauschtyp (z. B. SGI) dann gefunden ist, wenn dieser Abweichungswert (d) 
einen Extremwert hat. 

2. Verfahren nach Anspruch I. dadurch gekennzeichnet, 

daB nach dem Ermittein eines Storgerauschtyps (z. B. SGI) uber einen Codebuchmultiplexer (CBM) gezielt 
ein dafUr vorher trainierter Hidden-Markov-Spracherkenner mit an den Storgerauschtyp (SGI) angepaB- 
ten Codebuch (CBl) und Modellen (HMMl) angesteuerl wird, wodurch eine genauere Spracherkennung 
(SE) ermoglicht wird. 

3. Verfahren nach Anspruch \ , dadurch gekennzeichnet, 

daB aufgrund des erkannten Storgerauschtyps (z, B. SG2) SchaltmaBnahmen durchfuhrbar sind, die eine 
Beseitigung oder Reduzierung der Wirkung dieser Storgerauschquelle bewirken konnen. 

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, 

daB nach der Eliminierung eines Storgerauschtyps (z. B. SG2) erneute Spracheingaben und Berechnungen 
vorgenommen werden, wenn dies zur Ermittlung von weiteren Storgerauschtypen (SG) oder zur besseren 
Spracherkennung (SE) erforderlich ist. 
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